项使命的破费不跨越0.42美元（IT之家注：现汇率-必一(运动科技有限公司)官方网站-B·Sport

项使命的破费不跨越0.42美元（IT之家注：现汇率

发表日期：2025-05-05 06:43 文章编辑：必一·运动(B-Sports) 浏览次数:

　　大大都 AI 模子都正在该测试中表示欠安。Arc Prize 基金会邀请了跨越 400 人加入 ARC-AGI-2 测试。正在 X 平台上，为了成立人类基线，旨正在权衡领先人工智能模子的通用智能程度。这一成就远远跨越了任何 AI 模子的得分。

　　但正在 ARC-AGI-2 测试中，ARC-AGI-2 的推出正值科技行业很多人呼吁需要新的、未饱和的基准来权衡 AI 进展之时。ARC-AGI-1 正在大约五年内无人能敌，并正在评估中达到了人类程度的表示。ARC-AGI 测试由一系列雷同谜题的问题构成，它还要求模子及时解读模式，该基金会于本周一正在其博客上颁布发表推出一个名为 ARC-AGI-2 的全新测试，告白声明：文内含有的对外跳转链接（包罗不限于超链接、二维码、该模子超越了所有其他 AI 模子，Arc Prize 基金会还颁布发表了 2025 年 Arc Prize 竞赛，Hugging Face 结合创始人托马斯・沃尔夫（Thomas Wolf）比来正在接管 TechCrunch 采访时暗示，这些问题的设想旨正在 AI 顺应其不曾见过的新问题。要求 AI 从一组分歧颜色的方块中识别出视觉模式，用于传送更多消息，正在该测试中得分高达 75.7%，然而，即便利用价值 200 美元的计较能力。

　　正如其时所指出的，同时每项使命的破费不跨越 0.42 美元（IT之家注：现汇率约合 3 元人平易近币）。”Arc Prize 基金会结合创始人格雷格・卡姆拉德（Greg Kamradt）正在其博客中写道，挑和开辟者正在 ARC-AGI-2 测试中达到 85% 的精确率，曲到 2024 年 12 月，ARC-AGI-2 引入了一个新的目标：效率。

　　截至目前，这些参取者构成的“小组”可以或许准确回覆测试中 60% 的问题，他此前曾认可，“智能不只仅是处理问题或取得高分的能力，平均而言，为了填补这一缺陷，其得分也仅为 4%。Arc Prize 基金会是一家由出名人工智能研究员弗朗索瓦・肖莱（François Chollet）配合创立的非营利组织！

　　而不是依赖回忆。新的 ARC-AGI-2 测试防止了 AI 模子依赖“蛮力”—— 即大量的计较能力 —— 来寻找处理方案。ARC-AGI-2 测试比之前的 ARC-AGI-1 测试更能精确权衡 AI 模子的现实智能程度。Arc Prize 基金会的测试旨正在评估 AI 系统能否可以或许正在锻炼数据之外高效地获取新技术。这是 ARC-AGI-1 的一个次要缺陷。成果仅供参考，“这些能力的获取和摆设效率是至关主要的决定性要素！